智能论文笔记

Simultaneous Location of Rail Vehicles and Mapping of Environment with Multiple LiDARs

Yusheng Wang , Weiwei Song , Yidong Lou , Fei Huang , Zhiyong Tu , Shimin Zhang

分类：机器人

2021-12-25

精确和实时轨道车辆本地化以及铁路环境监测对于铁路安全至关重要。在这封信中，我们提出了一种基于多激光器的同时定位和映射（SLAM）系统，用于铁路应用。我们的方法从测量开始预处理，以便去噪并同步多个LIDAR输入。根据LIDAR放置使用不同的帧到框架注册方法。此外，我们利用来自提取的轨道轨道的平面约束来提高系统精度。本地地图进一步与利用绝对位置测量的全局地图对齐。考虑到不可避免的金属磨损和螺杆松动，在手术期间唤醒了在线外在细化。在收集3000公里的数据集上广泛验证了所提出的方法。结果表明，所提出的系统与大规模环境的有效映射一起实现了精确且稳健的本地化。我们的系统已应用于运费交通铁路以监控任务。

translated by 谷歌翻译

Rail Vehicle Localization and Mapping with LiDAR-Vision-Inertial-GNSS Fusion

Yusheng Wang , Weiwei Song , Yidong Lou , Yi Zhang , Fei Huang , Zhiyong Tu , Qiangsheng Liang

分类：机器人

2021-12-16

在本文中，我们介绍了全球导航卫星系统（GNSS）辅助激光乐队 - 视觉惯性方案RAILTOMER-V，用于准确且坚固的铁路车辆本地化和映射。 Raillomer-V在因子图上制定，由两个子系统组成：辅助LiDar惯性系统（OLIS）和距离的内径综合视觉惯性系统（OVI）。两个子系统都利用了铁路上的典型几何结构。提取的轨道轨道的平面约束用于补充OLI中的旋转和垂直误差。此外，线特征和消失点被利用以限制卵巢中的旋转漂移。拟议的框架在800公里的数据集中广泛评估，聚集在一年以上的一般速度和高速铁路，日夜。利用各个传感器的所有测量的紧密耦合集成，我们的框架准确到了长期的任务，并且足够强大地避免了退行的情景（铁路隧道）。此外，可以使用车载计算机实现实时性能。

translated by 谷歌翻译

RailLoMer: Rail Vehicle Localization and Mapping with LiDAR-IMU-Odometer-GNSS Data Fusion

Yusheng Wang , Yidong Lou , Yi Zhang , Weiwei Song , Fei Huang , Zhiyong Tu , Shimin Zhang

分类：机器人

2021-11-30

我们在本文中介绍Raillomer，实现实时准确和鲁棒的内径测量和轨道车辆的测绘。 Raillomer从两个Lidars，IMU，火车车程和全球导航卫星系统（GNSS）接收器接收测量。作为前端，来自IMU / Royomer缩放组的估计动作De-Skews DeSoised Point云并为框架到框架激光轨道测量产生初始猜测。作为后端，配制了基于滑动窗口的因子图以共同优化多模态信息。另外，我们利用来自提取的轨道轨道和结构外观描述符的平面约束，以进一步改善对重复结构的系统鲁棒性。为了确保全局常见和更少的模糊映射结果，我们开发了一种两级映射方法，首先以本地刻度执行扫描到地图，然后利用GNSS信息来注册模块。该方法在聚集的数据集上广泛评估了多次范围内的数据集，并且表明Raillomer即使在大或退化的环境中也能提供排入量级定位精度。我们还将Raillomer集成到互动列车状态和铁路监控系统原型设计中，已经部署到实验货量交通铁路。

translated by 谷歌翻译

MetroLoc: Metro Vehicle Mapping and Localization with LiDAR-Camera-Inertial Integration

Yusheng Wang , Weiwei Song , Yi Zhang , Fei Huang , Zhiyong Tu , Yidong Lou

分类：机器人

2021-11-01

我们提出了一种准确而坚固的多模态传感器融合框架，Metroloc，朝着最极端的场景之一，大规模地铁车辆本地化和映射。 Metroloc在以IMU为中心的状态估计器上构建，以较轻耦合的方法紧密地耦合光检测和测距（LIDAR），视觉和惯性信息。所提出的框架由三个子模块组成：IMU Odometry，LiDar - 惯性内径术（LIO）和视觉惯性内径（VIO）。 IMU被视为主要传感器，从LIO和VIO实现了从LIO和VIO的观察，以限制加速度计和陀螺仪偏差。与以前的点LIO方法相比，我们的方法通过将线路和平面特征引入运动估计来利用更多几何信息。 VIO还通过使用两条线和点来利用环境结构信息。我们所提出的方法在具有维护车辆的长期地铁环境中广泛测试。实验结果表明，该系统比使用实时性能的最先进的方法更准确和强大。此外，我们开发了一系列虚拟现实（VR）应用，以实现高效，经济，互动的轨道车辆状态和轨道基础设施监控，已经部署到室外测试铁路。

translated by 谷歌翻译

Belief Evolution Network-based Probability Transformation and Fusion

Qianli Zhou , Yusheng Huang , Yong Deng

分类：人工智能

2021-10-07

SMETS提出了具有可转移信念模型（TBM）中的决策层的有力概率转换（PPT），该决策层在没有更多信息的情况下认为，我们必须使用概率质量函数（PMF）做出决策。在本文中，通过在层次假设空间（HHS）中引入因果关系，提出了信仰进化网络（BEN）和全部因果关系。基于BEN，我们从信息融合视图中解释了PPT，并提出了一种称为完全因果关系概率转化（FCPT）的新概率转换（PT）方法，该方法在双标准评估下具有更好的性能。此外，我们启发性地提出了一种基于FCPT的新概率融合方法。与Dempster组合规则（DRC）相比，在融合相同的证据时，提出的方法具有更合理的结果。

translated by 谷歌翻译

Finding Point with Image: An End-to-End Benchmark for Vision-based UAV Localization

Ming Dai , Jiahao Chen , Yusheng Lu , Wenlong Hao , Enhui Zheng

分类：计算机视觉

2022-08-13

过去，图像检索是用于跨视图地理位置和无人机视觉本地化任务的主流解决方案。简而言之，图像检索的方式是通过过渡角度获得最终所需的信息，例如GPS。但是，图像检索的方式并非完全端到端。并且有一些多余的操作，例如需要提前准备功能库以及画廊构造的抽样间隔问题，这使得很难实施大规模应用程序。在本文中，我们提出了一个端到端定位方案，使用图像（FPI）查找点，该方案旨在通过源A的图像（无人机 - - 看法）。为了验证我们的框架的可行性，我们构建了一个新的数据集（UL14），该数据集旨在解决无人机视觉自我定位任务。同时，我们还建立了一个基于变压器的基线以实现端到端培训。另外，先前的评估方法不再适用于FPI框架。因此，提出了米级准确性（MA）和相对距离评分（RDS）来评估无人机定位的准确性。同时，我们初步比较了FPI和图像检索方法，而FPI的结构在速度和效率方面都可以提高性能。特别是，由于不同观点与剧烈的空间量表转换之间的巨大差异，FPI的任务仍然是巨大的挑战。

translated by 谷歌翻译

Image Quality Assessment with Gradient Siamese Network

Heng Cong , Lingzhi Fu , Rongyu Zhang , Yusheng Zhang , Hao Wang , Jiarong He , Jin Gao

分类：计算机视觉

2022-08-08

在这项工作中，我们介绍了梯度暹罗网络（GSN）进行图像质量评估。所提出的方法熟练地捕获了全参考图像质量评估（IQA）任务中扭曲的图像和参考图像之间的梯度特征。我们利用中央微分卷积获得图像对中隐藏的语义特征和细节差异。此外，空间注意力指导网络专注于与图像细节相关的区域。对于网络提取的低级，中级和高级功能，我们创新设计了一种多级融合方法，以提高功能利用率的效率。除了常见的均方根错误监督外，我们还进一步考虑了批处理样本之间的相对距离，并成功地将KL差异丢失应用于图像质量评估任务。我们在几个公开可用的数据集上试验了提出的算法GSN，并证明了其出色的性能。我们的网络赢得了NTIRE 2022感知图像质量评估挑战赛1的第二名。

translated by 谷歌翻译

Learning Pseudo Front Depth for 2D Forward-Looking Sonar-based Multi-view Stereo

Yusheng Wang , Yonghoon Ji , Hiroshi Tsuchiya , Hajime Asama , Atsushi Yamashita

分类：计算机视觉 | 机器人

2022-07-30

从2D前看声纳中检索声学图像中缺少的维度信息是水下机器人技术领域的一个众所周知的问题。有一些尝试从单个图像中检索3D信息的作品，该信息允许机器人通过飞行运动生成3D地图。但是，由于独特的图像配方原理，估计来自单个图像的3D信息面临严重的歧义问题。多视图立体声的经典方法可以避免歧义问题，但可能需要大量的观点来生成准确的模型。在这项工作中，我们提出了一种基于学习的新型多视角立体方法来估计3D信息。为了更好地利用来自多个帧的信息，提出了一种高程平面扫平方法来生成深度 - 齐路的成本量。正则化后的体积可以视为目标的概率体积表示。我们使用伪前深度来代表3D信息，而不是在高程角度上进行回归，而是可以避免声学成像中的2d-3d问题。只有两个或三个图像可以生成高准确的结果。生成合成数据集以模拟各种水下目标。我们还在大型水箱中构建了第一个具有准确地面真相的真实数据集。实验结果证明了与其他最新方法相比，我们方法的优势。

translated by 谷歌翻译

Efficient Video Deblurring Guided by Motion Magnitude

Yusheng Wang , Yunfan Lu , Ye Gao , Lin Wang , Zhihang Zhong , Yinqiang Zheng , Atsushi Yamashita

分类：计算机视觉

2022-07-27

由于空间和时间变化的模糊，视频脱毛是一个高度不足的问题。视频脱毛的直观方法包括两个步骤：a）检测当前框架中的模糊区域； b）利用来自相邻帧中清晰区域的信息，以使当前框架脱毛。为了实现这一过程，我们的想法是检测每个帧的像素模糊级别，并将其与视频Deblurring结合使用。为此，我们提出了一个新颖的框架，该框架利用了先验运动级（MMP）作为有效的深视频脱张的指南。具体而言，由于在曝光时间内沿其轨迹的像素运动与运动模糊水平呈正相关，因此我们首先使用高频尖锐框架的光流量的平均幅度来生成合成模糊框架及其相应的像素 - 像素 - 明智的运动幅度地图。然后，我们构建一个数据集，包括模糊框架和MMP对。然后，由紧凑的CNN通过回归来学习MMP。 MMP包括空间和时间模糊级别的信息，可以将其进一步集成到视频脱毛的有效复发性神经网络（RNN）中。我们进行密集的实验，以验证公共数据集中提出的方法的有效性。

translated by 谷歌翻译

A Multi-Stage Framework for the 2022 Multi-Structure Segmentation for Renal Cancer Treatment

Yusheng Liu , Zhongchen Zhao , Lisheng Wang

分类：计算机视觉

2022-07-19

计算机断层扫描（CTA）图像上的三维（3D）肾脏解析具有极大的临床意义。肾脏，肾肿瘤，肾静脉和肾动脉的自动分割在基于手术的肾癌治疗方面受益匪浅。在本文中，我们提出了一个新的NNHRA-UNET网络，并使用一个基于它的多阶段框架来细分肾脏的多结构并参加KIPA2022挑战。

translated by 谷歌翻译